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(54) Verfahren zur Stdrbefreiung eines Mikrophonsignals 



(57) FOr ein Verfahren zur Befreiung eines Mikro- 
phonsignals von StOrsignalanteilen durch Erzeugen 
eines Kompensationssignals und Subtraktion des Kom- 
pensationssignals vom Mikrophonsignal wird vorge- 
schlagen, die Kompensation vollstandig im 
Frequenzbereich vorzunehmen und auch das Aus- 
gangssignal im Frequenzbereich zu verarbeiten. Es 
werden MaBnahmen zur Verringerung des Aufwands 
bei der Signalverarbeitung angegeben. Vorteilhafte 
Weiterbildungen sehen beispielsweise vor, daG zur 



Stdrbefreiung eines Sprachsignals eine Filtereinstel- 
lung verwandt wird, welche in einer vorhergehenden 
Sprachpause gewonnen wurde, und/oder das fur lange 
Impulsantworten das Nachbildungsf ilter in mehrere Teil- 
fiiter aufgespaften wird. Die Erfindung ist insbesondere 
vorteilhaft fur die Befreiung eines Spracheingabesi- 
gnals in einem Fahrzeug von StOrsignalanteilen eines 
Radios Oder dgl., dessen Quellsignal als Referenzsi- 
gnal zur Verfugung steht. 
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Beschrelbung 

[0001 ] Die Erf indung betrifft ein Verfahren zur StOrbe- 
freiung eines Mikrophonsignals. 
[0002] Derartige Verfahren gewinnen insbesondere 
fur die Spracheingabe von Kommandos und/oder fur 
Freisprechtelefone zunehmend an Bedeutung, wobei 
insbesondere die Situation in einem Fahrzeug ein wich- 
tiger Anwendungsfall ist. 

[0003] Eine besondere Situation ist in Fahrzeugen 
haufig dadurch gegeben, daB ein Wiedergabegerat wie 
z.B. ein Radio, ein Kassetten- oder CD«Abspieler Ober 
einen Lautsprecher eine Gerauschumgebung erzeugt, 
die als StOrsignal ein von einem Mikrophon aufgenom- 
menes SprachsignaJ, beispieisweise for die Spracher- 
kennung Oder TelefonQbertragung Oberlagert. Zur 
Erkennung von Spracheingaben in einem Spracherken- 
ner oder zur verstandlichen Sprachubertragung Ober 
Telefbn ist das Mikrophonsignal sowelt wie mflglich von 
StOrsignalanteilen zu befreien. 
[0004] Das von einer Stdrquelle, insbesondere einem 
Lautsprecher ausgehende Sttirsignal gelangt nicht nur 
auf direktem kOrzestem Weg zum Mikrophon, sondern 
tritt auch noch Ober zahlreiche Reflexionen als eine 
Uberlagerung einer Mehrzahl von Echos mit verschie- 
denen Laufzeiten im Mikrophonsignal in Erscheinung. 
Die gesamte Elnwirkung des StOrsignals von der Stflr- 
quelle auf das Mikrophonsignal kann durch eine a priori 
unbekannte Ubertragungsfunktion des Raumes, bei- 
spieisweise des Fahrgastraumes eines Kraftfahrzeugs 
beschrieben werden. Die Ubertragungsfunktion andert 
sich je nach Besetzung des Fahrzeugs und nach Posi- 
tion der einzelnen Personen. Durch Nachbildung dieser 
Ubertragungsfunktion und Filterung eines Referenzsi- 
gnals von der StOrquelle mit dieser Nachbildung kann 
ein Kompensationssignal erzeugt werden, welches 
durch Subtraktion vom Mikrophonsignal ein vom StOrsi- 
gnal befreites Signal, beispieisweise ein reines Sprach- 
signal liefert. Im Rearfall stellt die genannte 
Nachbildung eine mehr oder minder gute Annaherung 
an die unbekannte Ubertragungsfunktion dar und die 
StOrung kann nicht vollstandig beseitigt werden. 
[0005] Aufgabe der vorliegenden Erf indung ist es, ein 
Verfahren zur StOrbefreiung eines Mikrophonsignals 
anzugeben, daft bei vertretbarem Signalverarbeitungs- 
aufwandgute Eigenschaften hinsichltich der EntstOrung 
aufweist. 

[0006] Die Erfindung ist im Patentanspruch 1 
beschrieben. Die UnteransprOche enthalten vorteilhafte 
Ausgestaltungen und Weiterbildungen der Erfindung. 
[0007] Wesentlich an dem erfindungsgemaBen Ver- 
fahren ist, daB die Kompensation des StOrsignalanteils 
im Mikrophonsignal mittels eines aus dem Referenzsi- 
gnal Ober die Nachbildung der Ubertragungsfunktion 
erzeugten Kompensationssignais im Frequenzbereich 
vorgenommen wird, so daB Mikrophonsignal, Kompen- 
sationssignal und Ausgangssignal im Frequenzbereich, 
d.h. in Form von Spektren vorliegen. Die Signalverar- 



beitung in diesem Verfahrensschritt im Frequenzbereich 
erfordert zwar eine spektrale Transformation des Mikro- 
phonsignals, berOcksichtigt aber, daB die Nachbildung 
der Ubertragungsfunktion im Frequenzbereich vorteil- 

5 hafter ist und stellt fur eine vorteilhafte nachfolgende 
zusatzliche Gerauschreduktion des Ausgangssignals, 
die typischerweise gleichfalls im Frequenzbereich vor- 
genommen wind, bereits eine besonders geeignete 
Signalform bereit. 

10 [0008] Durch einfache Naherungen beim Ersatz eines 
Verarbeitungsschritts mit einem Zeitfenster kann durch 
Obergang zu einer Faltung im Frequenzbereich eine 
deutliche Reduzierung des Verarteitungsaufwands 
reduziert werden. 

is [0009] FOr lange Impulsantworten der Gbertragungs- 
funktion bzw. deren Nachbildung sieht eine vorteilhafte 
Weiterbildung der Erfindung eine Aufteilung des Nach- 
bildungsfilters in mehrere Teitfilter zu zeitversetzten 
Segmenten des segmentierten Referenzsignals vor, 

20 deren Kbeffizienten-Aktualisierung zeitlich gestaffelt 
sein kann, wodurch der Signalverarbeitungsaufwand 
gering gehalten werden kann. 
[0010] Als besonders vorteilhaft erweist es sich, die 
EntstOrung eines Sprachsignals auf der Basis einer Ein- 

25 stellung des Nachbildungsfilters, die in einer vorherge- 
henden Sprachpause gewonnen und gespeichert 
wurde, vorzunehmen. 

[001 1 ] Die Aufteilung des Nachbildungsfilters in meh- 
rere Teitfilter und die StOrbefreiung auf der Basis einer 

30 in einer Sprachpause gewonnenen Filtereinstellung 
sind auch unabhangig von der StOrsignalkompensation 
im Frequenzbereich eigenstandig fur die StOrbefreiung 
eines Mikrophonsignals realisierbar und vorteilhaft. 
[0012] Die Erfindung ist nachfolgend anhand von 

35 bevorzugten AusfOhrungsbeispielen unter Bezugnahme 
auf die Abbildungen noch eingehend veranschaulicht. 
Dabei zeigt: 

Fig. 1 ein Prinzip der Kompensation eines Radio- 
40 signals 

Fig. 2a ein Blockschaltbild zu Fig. 1 

Fig. 2b ein Blockschaltbild zur Filternachbildung 

45 

Fig. 3 ein detailliertes Beispiel zu Fig. 2b 

Fig. 4 eine Erweiterung auf mehrere Teitfilter 

so Fig. 5 einen Obergang zur Kompensation im Fre- 
quenzbereich 

Fig. 6 ein detailliertes Beispiel zu Fig. 5b 

55 Fig. 7 ein AusfOhrungsbeispiel mit mehreren Teil- 
firtern 

Fig. 8 ein AusfOhrungsbeispiel mit Speicherung 



2 



3 



EP 0 948 237 A2 



4 



der Filtereinstellungen 
Fig. 9 Signale einer synthetischen Beispielsszene 

Fig. 1 0 Impulsantwort und Obertrag ungsf unktion zu 
Fig. 9 

Fig. 1 1 Signal einer ersten MeBszene 

Fig. 1 2 Impulsantwort und Obertragungsf unktion zu 
Fig. 11 

Fig. 13 das Beispiel nach Fig. 11 mit Speicherung 
der Filtereinstellungen 

Fig. 14 eine Sprachpausendetektion zu Fig. 13 

Fig. 15 Impulsantwort en und Ubertragungsfunktio- 
nen zu Fig. 11 und Fig. 13 

Fig. 16 Obergang von einem Zeitfenster zu einer 
Faltung im Frequenzbereich 

Fig. 17 ein Rechteck-Zeitfenster mit Linienspek- 
trum 

Fig. 18 ein Hamming-Zeitfenster mit Linienspek- 
trum 

Fig. 19 Staffelung von SignalblOcken bei der Filter- 
berechnung 

Fig. 20 Signale einer zweiten MeBszene 

Fig. 21 eine Sprachpausendetektion zu Fig. 20 

Fig. 22 Impulsantworten und Obertragungsfunktio- 
nen zu Fig. 20 und Fig. 21 

Fig. 23 Signale einer dritten MeBszene 

Fig. 24 eine Sprachpausendetektion zu Fig. 23 

Fig. 25 Impulsantworten und Ubertragungsfunktio- 
nen zu Fig. 23 und Fig. 24 

Fig. 26 Signale einer vierten MeBszene 

Fig. 27 eine Sprachpausendetektion zu Fig. 26 

Fig. 28 Impulsantworten und Ubertragungsfunktio- 
nen zu Fig. 26 und Fig. 27. 

[0013] Fig. 1 stellt das Prinzip einer Einrichtung zur 
(einkanaligen) Radiosignalkompensation dar. Das vom 
Lautsprecher abgestrahlte akustische Signal gelangt 
auf direktem Wege, aber auch uber zahlreiche Reflek- 
tionen im Fahrzeuginnenraum, auf das Mikrophon des 



Spracheingabesystems. Unter der Annahme, daB sich 
die Obertragungsstrecke G demnach als Transversalfil- 
ter mit einer gewichteten Summe zeitlich verzOgerter 
Echos darstellt, laBt sich eine Filternachbiidung H fin* 

5 den, die im Idealfall H=G eine vollstandige Kompensa- 
tion des Radiosignales ermdglicht. 
[0014] Das Lautsprechersignal x wird durch die a 
priori unbekannte Ubertragungsfunktion G des Fahr- 
zeuginnenraumes gef iltert. Es entsteht die StOrkompo- 

10 nente r, die sich mit dem Sprachsignal s zu dem 
Mikrophonsignal y addiert Urn die StOrkomponente r zu 
kompensieren, wird mittels der Filternachbiidung H ein 
Sch&tzwert r A aus dem Lautsprechersignal x erzeugt. 
Der Ausgang der Schaltung liefert den Schatzwert fur 

is das Sprachsignal: 

s A ■ s + r - r A = s+E 

[0015] Dem Sprachsignal s ist also am Ausgang der 

20 Schaltung noch das Fehlersignal E=r-r A uberlagert, 
welches in der Praxis mOglichst klein gehalten werden 
soilte. Das Sprachsignal kann noch StOrungen in Form 
von z.B. Motorgerduschen oder externen Gerduschen 
enthalten, die aber in diesem Zusammenhang nicht 

25 explizit behandelt werden. 

[0016] H ist ein adaptives Filter und arbeitet nach 
einem in der Uteratur bekannten Standardverfahren, 
dem LMS-Algorrthmus (least mean squares). Neben 
dem Eingangssignal x wird noch das Fehlersignal E 

30 benfltigt, urn die Koeffizientenadaption im Filter H zu 
bewerkstelligen. Hierfur ist das Ausgangssignal s A der 
Bestimmung der Filterkoeff izienten zugefuhrt. 
[0017] Fig. 2a zeigt in anderer Darstellung nochmals 
die Anordnung von Fig. 1 als Radiosignalkompensation. 

35 Das adaptive System H kann z.B. im Zeitbereich als 
FIR-Filter (finite-impuIse-response-Filter) realisiert wer- 
den. Bei groBen Impulsantwortidngen, wie sie in der 
Praxis haufig auftreten, ist hierzu alierdings ein sehr 
hoher Rechenaufwand notwendig. Verschiedene Vor- 

40 teile gegenuber einer ZeitbereichslOsung bietet die 
Reafisierung des LMS-Algorithmus im Frequenzbereich 
(FLMS). Wegen der blockweisen Verarbeitung von 
Daten in den als diskreten Fouriertransformationen rea- 
lisierten spektralen Transformationen und der Filterrea- 

45 lisierungtim Frequenzbereich durch Muitipiikationen 
wird dieses Verfahren besonders rechenzeitgunstig. 
[0018] Fig. 2b zeigt ein Blockschaltbild des FLMS- 
Algorithmus. Die zugehGrige Theorie ist an sich 
bekannt und daher an dieser Stelle nicht im Detail 

so behandelt. Es bedeuten F eine spektrale Transforma- 
tion FFT eines Zeitsignals in den Frequenzbereich und 
F 1 die inverse IFFT. Die als Projektionen P1, P2 und P3 
bezeichneten Verarbeitungsschritte dienen der korrek- 
ten Segmentierung der Daten durch die blockweise Ver- 

55 wendung mit der FFT bzw. IFFT und werden spfiter 
noch genauer erldutert. Die Arbeitsweise des Filters 
besteht in der Multiplikation des Referenzspektrums X 
mit dem Filter-Kbeffizientenvektor H. Das Spektrumdes 
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Filterausgangs R A wird Qber P 1 zurOck in den Zeitbe- 
reich transformiert. Nach Anwendung der Projektion P2 
auf den Reatteil des so erhartenen Kompensationssi- 
gnals stent das Signal r A zur VerfOgung. Die Differenz 
der Signale s 

s A = y-r A = s + r-r A = s + E 

stellt den eigentiichen Ausgang. eine Schatzung der 
Spracheingabe, dar. 10 
[001 9] Wesentlicher Bestandtei! des adapti ven Fitters 
ist die Koeffiiientenadaption im Block K, die im Fig. 2b 
durch die Erneuerungsgleichung 

H' = H* + AH' is 

beschrieben wird. Die hier mit zwei spektralen Transfor- 
mationen besonders aufwendige Projektion P1 berech- 
net aus K den fur die Filterung benOtigten 
Koeffizientenvektor H. Zur Berechnung des Korrektur- 20 
vektors AH' wird neben dem Referenzspektrum X das 
Spektrum S A des mit P 3 bewerteten Ausgangssignales 
s + r - r A benOtigt. 

[0020] Ein detail liertes Blockschaltbild des in Fig. 2b 
dargestellten FLMS-Algorithmus zeigt Fig. 3. Die Abt- 25 
astwerte eines Signals und die StOtzstellen der FFT 
seien in gebrduchlicher Weise als samples bezeichnet. 
Alle Spektraltransformationen und deren Inverse sind 
als 256-Punkte - FFTs, die jeweils urn 128 samples 
uberlappen, zu segmentieren. Zu beachten ist, da 3 sich 30 
das Ausgangssignal s A im Zeitbereich aus 128-sample- 
BlOcken zusammensetzt. Es entsteht aus der Differenz 
der zweiten Blockh&lften (also jeweils der samples 129 
bis 256) von Mikrofonsignal und gef iltertem Kompensa- 
tionssignal r A . Aufwendig ist die Projektion P1, die 2 35 
FFTs benOtigt und den Vektor H' in den Vektor H 
umrechnet. Hierbei wird aus dem komplexen 256- 
Punkte-Ergebnisvektor der RQcktransfbrmation vom 
Frequenz-in den Zeitbereich (IFFT) die erste Haifte 
(samples 1 bis 128) ausgeschnitten und die zweite 40 
Haifte (samples 129 bis 256) zu Null gesetzt. Nach 
Anwendung dieses Rechteckfensters im Zeitbereich 
erfolgt wieder mittels FFT die Transformation in den Fre- 
quenzbereich. Einfach ist die Projektion P2. Siebesteht 
aus der oben schon beschriebenen Ausschnittsbildung 45 
der letzten 128 samples, wodurch aus uberlappenden 
256-sample-BIOcken wieder nicht uberlappende 128- 
sample-BICcke entstehen. Ebenfalls sehr einfach ist 
schlieBlich auch die Projektion P3, welche umgekehrt 
aus nicht uberlappenden 128-sample-BIOcken des Aus- so 
gangssignales durch Voranstellen von 128 Nullwerten 
wiederum uberlappende 256-sanple-BIOcke bereit- 
stellt. Die Adaption der Filtertoeffizienten H' L+1 fur 
einen ZyWus L+1 besteht aus der Addition eines 
Erneuerungsvektors AH' L zum alten Koeffizientenvektor 55 
H' L . Diese Erneuerung errechnet sich aus dem Produkt 
zwischen dem Spektrum S\ des Ausgangssignals und 
dem konjugiert komplexen Spektrum X* L des Referenz- 



signales - gewichtet mit einer spektralen Leistungsnor- 
mierung 2m_, AH' L =2u L • X* L • S A L . Zum Zweck 
dieser Leistungsnormierung ist der mit einer Konstan- 
ten 2a multiplizierte Kehrwert des gegiatteten Referenz- 
leistungsspektrums S^l zu berechnen 
2ji L = 2a/S xx L , wozu ein rekursives Filter 1. Ordnung 
mit einer Konstanten p dient 

Sxx.i = e • ix L i z +d-P) • s aJL . v 

[0021] Die Arbeitsweise des LMS-Algorrthmus wird 
erheblich von der Adaptionskonstante a und der Giat- 
tungskonstante p beeinfluflt. Zwischenspeicher in 
Rekursionsschleifen sind mit Sp bezeichnet. 
[0022] Die bisher beschriebene Anordnung des 
FLMS-Algorithmus erlaubt Filternachbildungen mit 
einer maximalen Impulsantwortldnge von einer halben 
FFT-Lange, im Beispielsfall also 128 samples. Sollen 
tangere Impulsantworten kompensiert werden, ist der 
schon bekannte FLMS-Algorithmus fur einen Teilfilter 
(Fig. 4a) auf n Teilfilter zu erweitern. Eine 3-Teilfilter- 
LOsung mit einer Impulsantwortiange von 3 • 128=384 
samples hat sich bei der RadiosignalunterdrQckung im 
Pkw mit einem Spracheingabesystem bewShrt (Fig. 
4b). Der im Fig. 4a mit B bezeichnete Block mit den Ein- 
gangssignalen X und S A und dem Kbmpensations- 
Spektrum R A als Ausgang ist durch die im Fig. 4b dar- 
gestellte Erweiterung zu ersetzen. Das Spektrum X des 
Referenzsignals wird durch Zwischenspeicher D urn 1 
bzw. 2 BlocWangen verzOgert und das unverzOgerte X1 
und die beiden verzOgerten Spektren X2, X3 werden 
separat in mit in einer erwe'rterten Projektion P1 
getrennt bestimmten Koeffizientenvektoren H1 , H2, H3 
multipliziert. Die Bildung der Koeffizientenvektoren 
erfolgt analog zum Fall nur eines Tei If liters, wobei in K1 , 
K2, K3 jeweils das zugehOrige Referenzspektrum mit 
dem Spektrum S A des Ausgangssignals verknOpft wird. 
Der Aufwand wird hauptsdchlich durch die Verdreifa- 
chung der Projektion P1 betrachtlich erhdht. Zusatzli- 
cher Speicherplatzbedarf wird notwendig urn die 
Spektren des urn 1 bzw. 2 BlocWangen zeitiich aiteren 
Referenzsignales X bereitzustellen. 
[0023] Bei der beispielhaft angegebenen Aufgaben- 
stellung der UnterdrOckung des Radiosignales bei 
Spracheingabe im Kfz ist es vorteilhaft die Ausgangsda- 
ten nicht im Zeit- sondern im Frequenzbereich auszuge- 
ben, da dadurch eine verbesserte Anpassung an eine 
nachgeschaltete GerauschunterdrQckung erreicht wer- 
den kann. Der bereits vorgestellte FLMS-Algorithmus 
m'rt einem Teilfilter benOtigt gemaft Fig. 5a insgesamt 5 
FFTs bei einem Ausgangssignal im Zeitbereich. Wird 
dem Ausgang eine FFT nachgeschaltet, erhOht sich der 
Aufwand bei einem Frequenzbereichs-Ausgangssignal 
auf 6 FFTs. Die gleiche FFT-Anzahl ergibt sich 
zunachst auch bei einer dquivalenten LOsung nach Fig. 
5b. Diese Variante besitzt jedoch folgende Vorteile: 

Bei der zeitgieichen Spektralanalyse der Signale x 
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und y 1st nur eine einzige 256-Punkte-FFT mlt 
geringem Zusatzaufwand fOr eine spektrale Sepa- 
ration notwendig. Man erziett eine Einsparung von 
1 FFT. 

5 

Die hier mit P4 gekennzeichnete und neu def inierte 
Projektion ist bis auf das verwendete Zeitfenster 
formal identisch mit der Projektion P1. Wie spater 
gezeigt wird, laGt sich P4 durch eine relativ einfa- 
che Faltungsoperation im Frequenzbereich ersetz- 10 
ten, ohne daB eine merWiche EinbuBe an Qualitat 
in Kauf genommen werden muB. Man erzielt eine 
Einsparung von 2 FFTs. 

[0024] Fig. 6 stellt ein ausfOhrlicheres Blockschaltbild is 
des FLMS-Algorithmus mit Frequenzbereichs-Aus- 
gangssignal dar und gestattet nochmals einen Ver- 
gleich mit Fig. 3 (Zeitbereichs-Ausgang). Unverdndert 
geblieben ist die Filteradaption bestehend aus Giattung 
der spektralen Leistung, Leistungsnormierung und 20 
Koeffizientenerneuerung. Neu sind die FFT im Mikro- 
phonkanal, die Differenzbildung Y-R A im Frequenz- 
anstatt im Zeitbereich zur Ausgangsbildung, und 
schlieBlich die neu definierte Projektion P4, welche sich 
ledigiich durch das komplementare Zeitbereichsfenster 25 
von der Projektion P1 unterscheidet. 
[0025] Als Vorstufe einer nachfolgend beschriebenen 
bevorzugten AusfQhrung betrachte man Fig. 7. Darge- 
stellt ist der FLMS-Algorithmus mit 3 Teilfiltern (384- 
sample-lmpulsantwort), welcher eine ausreichende 30 
UnterdrOckung des Radiosignales im Mikrophonkanal 
des Spracheingabesystems liefert. Die Projektionen P1 
und P4 sind vereinfacht dargestellt. Es ist der schon aus 
Fig. 4b bekannte zusdtzliche Aufwand in Form der Spei- 
cher P sowie die Verdreifachung der Projektion P1 35 
ersichtlich. Im Gegensatz zur 1-Teilfilter-L6sung nach 
Fig. 6 wird die Summe W von gegenwartigem und den 
beiden zeitlich vorausgegangenen Referenz-Leistungs- 
spektren auf den Eingang des rekursiven Filters gege- 
ben. Die Tatsache, daB am Filterausgang nun praktisch 40 
die 3-fache gegiattete spektrale Leistung vorliegt, wird 
nach der Kehrwertbildung durch Multipiikation mit der 
Konstanten 6a berOcksichtigt. Nach der spektralen Lei- 
stungsnormierung des in P4 modifizierten Ausgangs- 
spektrums S A wird die Filter-Adaption nun fQr die 3 45 
Koeffizientenvektoren der 3 Teilfilter separat durchge- 
fOhrt. 

[0026] Ein Beispiel Z0 fQr die Wirkungsweise der 
Erfindung nach Fig. 7 zeigt Fig. 9. Die Eingangsdaten 
wurden synthetisch generiert. Das Referenzsignal X so 
stellt 100000 Abtastwerte eines weiBen GauBrau- 
schens bei einer Abtastfolgefrequenz von fs=12 kHz 
dar. Das Mikrophonsignal Y entstand durch Faltung die- 
ses Rauschsignales mit einer ebenfalls konstruierten 
384-sample-lmpulsantwort sowie der Addition eines ss 
auBerst schwachen Sprachsignales. Beim AbhOren die- 
ses in Fig. 9 oben aufgezeichneten Signals y sind die 10 
gesprochenen Ziffern gerade noch im farbigen (weil 



gefllterten) Rauschen zu erkennen. Das In den Zeitbe- 
reich zurOcktransformierte Ausgangssignal des Schat- 
zers bef reit nach einem ca. 1 Sekunde (1 2000 samples) 
dauernden Einschwingvorgang sehr wirkungsvoll die 
Spracheingabe vom Rauschen und liefert ein unverzerr- 
tes jedoch leicht verhalltes Sprachsignal S A (Fig. 9 
urrten). Die verwendeten beiden Parameter waren 
0=0,05 und p=0,5, Werte, die sich auch bei den spater 
vorgestellten Beispielen gut bewdhrt haben. 
[0027] Aus den jeweils 1 29 samples langen Teilkoeff i- 
zientenvektoren H1, H2, H3 der 3 Teilfilter nach Bild7 
laBt sich nun zu jedem Zeitpunkt die hieraus resultie- 
rende 3M28-sample-lmpulsantwort bzw. die zugehO- 
rige FilterQbertragungsfunktion berechnen. So zeigt 
Fig. 10 oben die 384-sample-lmpulsantwort, wie sie 
sich ganz am Ende der Szene- also nachdem die Ziffer 
"0" gesprochen wurde - ergibt. Sie ist ein sehr genaues 
Abbild derjenigen Impulsantwort, die zur Faltung mit 
weiBem GauBrauschen und damit zur synthetisch en 
Generierung des Signales mikro benutzt wurde. Die 
zugehttrige BetragsObertragungsfunktion (Fig. 10 
urrten) im Bereich zwischen den Frequenzen 0 und fs/2 
= 6 kHz stellt einen mit zahlreichen schmalbandigen 
ResonanzOberhOhungen behafteten TiefpaBfrequenz- 
gang dar. 

[0028] WeiBes Rauschen als Referenzeingangssignal 
und gefiltertes "farbiges" Rauschen als Mikrophonain- 
gangssignal stellen im Sinne der Aufgabenstellung, 
eine Nachbildung dieses Filters zu f inden, den einfach- 
sten Fall dar. Da das Referenzsignal per Definitionen 
alle Frequenzanteile enthait, gelingt die Filteradaption 
hier am schnellsten. Die zusatzjiche additive Sprachein- 
gabe im Mikrophoneingangssignal - also das eigentli- 
che Nutzsignal des Spracheingabesystems - stellt fQr 
den (F)LMS-Algorithmus eine Stdrung dar, welche die 
korrekte Adaption der Filterkoeffizienten behindert. 
Anders ausgedrQckt: nur in Sprachpausen ist das 
System dazu in der Lage die Raumakustik des Fahr- 
zeuginnenraums (Strecke Radiolautsprecher zum 
Mikrophon) richtig nachzubilden und dadurch eine 
Kbmpensation der Radiowiedergabe zu bewirken. Im 
oben demonstrierten Beispiel gemaB Fig. 9 gelingt dies 
sehr gut, da der Mikrophon-eingang im wesentlichen 
aus Rauschen und nur zu einem sehr geringen Teil aus 
Spracheingabe besteht. 

[0029] Aus echten Messungen im Fahrzeug hingegen 
entstammten das an den Radiolautsprecherklemmen 
abgegriffene Referenzsignal radio und das vom Mikro- 
phon des Spracheingabesystem aufgezeichnete Signal 
mikro der Szene Z1. Dieses Mikrophonsignal ist in Fig. 
11 oben dargestellt, besteht aus 100000 samples und 
besitzt demnach bei einer Sampling-Frequenz von 12 
kHz eine zeitliche Dauer von ca. 8,3 Sekunden. Es han- 
delt sich urn flQssig und relativ schnelle gesprochene 
Sprache eines hinten rechts im Auto sitzenden Fahr- 
zeuginsassen, wdhrend gleichzeitig Musik mit normaler 
Lautstarke aus dem Autoradio-Lautsprecher erklingt. 
Nach Anwendung der EntstOrmaBnahme gemaB Fig. 7 
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und Umrechnung in den Zeitbereich ergibt sich das in 
Fig. 1 1 unten dargestellte Ausgangssignal. Der HOrtest 
ergibt eine deutliche Herausarbeitung des Sprachan- 
teils bzw. eine vor allem in den Kurzen Sprachpausen 
bemerkenswerte Musikunterdruckung. Auffailig und von 5 
Nachteil ist jedoch, daft die erwOnschte Radiosignalun- 
terdrOckung in starkem MaBe davon abhdngt, ob 
gerade gesprochen wird Oder nicht. Die wieder am Sze- 
nenende ermittelte 384-sample-lmpulsantwort mit 
zugehOriger Ubertragungsfunktion ist aus Fig. 12 10 
ersichtlich. Eine korrekte Impulsantwort ist an den typi- 
schen Nullsamples (Totzeit) am Anfang zu erkennen, 
welche von der Laufzeit des Direktschails vom Radio- 
lautsprecher zum Mikrophon herrOhren. Aus den hier 
vorhandenen starken StOrungen am Anfang sowie am 15 
Ende der Impulsantwort last sich demnach der Sch!u(3 
Ziehen, daB die Filteradaption an dieser Stelle wegen 
vorhandener Spracheingabe auBerst unzureichend ist. 
[0030] Die im folgenden anhand von Fig. 8 beschrie- 
bene Ausf uhrungsform beruht auf folgender Grundidee: 20 
ein geeignetes Merkmal dient zusammen mit einem 
Schwellenwert als Indikator fur eine Spracheingabe. 
Unterschreitet das Merkmal die Schwelle, so ist dies ein 
Anzeichen fur fehlende Spracheingabe. In diesem Fall 
kann - wie oben schon festgestellt - eine we'rtgehend zs 
ungestOrte Filteradaption erfolgen. Bei Spracheingabe 
wird nun auf denjenigen Filterkoeffizientensatz zurOck- 
gegriffen, der unmittelbar vor der SchwellenOberschrei- 
tung - d.h. am Ende der vorangegangenen 
Sprachpause - abgespeichert wurde. Diese gespei- 30 
cherten Koeffizienten H10, H20, H30 liefern im Regelfall 
eine deutlich bessere Radiosignal-Kompensation als 
die unter dem stOrenden EinfluB der Spracheingabe 
sich standig dndernden aktuellen Koeffizienten H, H2, 
H3. 35 
[0031] Fig. 8 stellt eine Ausfuhrung mit einer weiter 
verbesserten FLMS-Verarbeitung mit 3 Teilfiltern dar. 
Neben den schon in Fig. 7 vorhandenen aktuellen Fil- 
terkoeffizientenvektoren H1, H2, H3, welche zur Bildung 
des fortlaufend adoptierten Ausgangssignals y-R benO- 40 
tigt wurden, existiert nun ein zusatzliches Ausgangssi- 
gnal (y-Ro), das unter Verwendung gespeicherter 
Koeffizienten H10, H20, H30 gebildet ist. Die aktuellen 
Koeffizientensatze H1, H2, H3 stellen nur bei fehlender 
Spracheingabe im eingeschwungenen Zustand ein 45 
brauchbares Kompensationsfilter im Frequenzbereich 
dar, liefern hingegen bei Spracheingabe ungenQgende 
Filtereigenschaften, weil der AdaptionsprozeB in der 
Regelschleife standig gestOrt wird. Bei fehlender 
Spracheingabe d.h. hoher Filterqualitat sind die drei so 
Schalter geschlossen und es werden die aktuellen 
Koeffizientensdtze in die Kbeffizientenspeicher M1, M2, 
M3 geschrieben: H10=H1, H20=H2, H30=H3. Die Aus- 
gange (y-Ro) und (y-Ra) sind identisch. Einsetzende 
Spracheingaben bewirken ein Offnen der 3 Schalter, 55 
wodurch die zuletzt in den Speichern M1, M2, M3 
befindlichen Koeffizienten H10, H20, H30 nicht mehr 
uberschrieben werden und unverandert bleiben. Dieser 



Zustand, in welchem sich die Ausgange (Y-Ro) und (Y- 
Ra) unterschieden, wird solange beibehalten, bis wie- 
der eine Sprachpause detektiert und die Schalter 
geschlossen werden. 

[0032] Als Sprachpausenmerkmal fea hat sich die 
gegiattete Summe alter Absolutwerte der Koeffizienten- 
korrekturvektoren AH1\ AH2\ AH3' bewahrt (Fig. 8a). 
Diese GrOBe ist gleich Null bzw. weist Weine Zahlen- 
werte auf, wenn es keinen oder nur einen geringen 
Bedarf gibt, die Koeffizienten abzuandern. In Sprach- 
pausen ist dies der Fall, der Regelkreis ist praktisch ein- 
geschwungen. StOrungen, wie sie durch 
Spracheingabe • aber auch durch Bewegungen der 
Fahrzeuginsassen - hervorgerufen werden, haben 
einen erhOhten Nachregelbedarf zur Folge, was sich 
durch entsprechend groBe Zahlenwerte bei AH1\ AH2', 
AH3' und somit beim Merkmal fea bemerkbar macht. 
Ein Giattungsfilter beispielsweise ein rekursiver TiefpaB 
1. Ordnung mit dem Eingang feat stellt an seinem Aus- 
gang das gegiattete Sprachpausen-Merkmal fea zur 
Verfugung, welches nach Vergleich mit einem Schwell- 
wert th die Schalter fur die Koeffizientenubemahme 
steuert. 

[0033] Die Wirkungsweise des verbesserten FLMS- 
Algorithmus nach Fig. 8 demonstriert Fig. 13. Oben ist 
das aufgezeichnete Signal y der Szene Z1 (vgl. Fig. 1 1 
oben) dargestellt, unten das gewonnene Ausgangssi- 
gnal. Schon der visuelle Vergleich der Ausgangssignale 
von Fig. 13 und Fig. 1 1 zeigtdie verbesserte Herausar- 
beitung der Sprachpassagen. Der vergleichende HOr- 
test bestatigt dies: auch wahrend der Spracheingabe ist 
die Musikunterdruckung deutlich besser. Den Verlauf 
des Sprachpausenmerkmals und der konstanten 
Schwelle uber der Zeit (hier in FFT-BIOcken skaliert) 
zeigt Fig. 14 oben. In den durch die Schwellenunter- 
schreitung detektierten Sprachpausen (Fig. 14 unten) 
findet laufend die Obernahme der Koeffizienten in die 
Speicher wie beschrieben start, um dort wahrend der 
Spracheingabe als gespeicherte Koeffizienten zur Ver- 
fOgung zu stehen. Die schon in Fig. 12 am Szenenende 
gemessene 384-sample-lmpulsantwort mit zugehOriger 
BetragsQbertragungsfunktion ist in Fig. 15 als aktuelle 
Impulsantwort (a) bzw. aktuelle Ubertragungsfunktion 
(b) dargestellt. Im Gegensatz zu dieser infolge Sprach- 
eingabe stark gestOrten Schatzung aus den aktuellen 
Koeffizienten H1, H2, H3 ist aus den gespeicherten 
Koeffizienten H10, H20, H30 eine Impulsantwort (c) und 
eine Ubertragungsfunktion (d) hoher Qualrtat berechen- 
bar. Die Impulsantwort aus den gespeicherten Koeffizi- 
enten weist die typischen Nullsamples am Anfang auf, 
welche durch die Laufzeit des Direktschails vom Radio- 
lautsprecher zum Spracheingabemikrophon verursacht 
werden. Aus der im Beispielsfall abzulesenden Totzeit 
von ca. 40 samples laBt sich die Entfernung zwischen 
Lautsprecher und Mikrophon bestimmen. 
[0034] Wie vorstehend schon angedeutet laBt sich die 
aufwendige Projektion P4 (IFFT, Fenster rechts im Zeit- 
bereich, FFT) ohne merWiche EinbuBe an Qualitat 
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durch eine relativ einfache Faltung im Frequenzbereich 
ersetzten, wodurch 2 FFT's eingespart werden. Dazu 
betrachte man Fig. 16. In einem ersten Schritt wird das 
"rechtsseitige" 128-sample-Rechteckfenster im Zeitbe- 
reich (Fig. 16a) bei der idealen Projektion ersetzt durch 
ein 128-samp!e-Hammingfenster(Fig. 16b). Gegenuber 
dem Rechteckfenster besitzt dieses den Vorteil eines 
bedeutend schmaleren Spektrums. Wie Fig. 17 zeigt, 
besteht beim Rechteckfenster der Realteil des Spek- 
trums aus einer einzigen Linie (Gleichanteil), wahrend 
das zur Mitte antisymmetrische Imaginarteil-Spektrum 
aus vielen nach auBen hin langsam abfallenden Linien 
mit alternierenden Nullstellen besteht. Im Gegensatz 
dazu beschrankt sich das komplexe Spektrum des 
Hammingfensters (Fig. 18) auf insgesamt 7 Linien, von 
denen im symmetrischen Realteil nur 3 und im antisym- 
metrischen Imaginarteil nur 4 Werte von Null verschie- 
den sind. Samtliche weiter auBen liegenden Anteile 
sind vernachldssigbar gering. Diese spezielle Eigen- 
schaft des Hammingfensters ermfiglicht es vorteilhaf- 
terweise die Multiplikation im Zeitbereich (Fig. 16b) zu 
ersetzen durch eine Faltung mit dem zugehOrigen 7- 
sample-Spektrum im Frequenzbereich und damit eine 
IFFT und eine FFT einzusparen (Fig. 16c). 
[0035] Prinzipiell laBt sich natQrlich auch die Projek- 
tion P1 (IFFT - linksseitiges Rechteckfenster - FFT) 
ersetzen durch eine entsprechende Faltungsoperation 
im Frequenzbereich mit dem konjugiert komplexen 7- 
Linien-Spektrum. Experimente haben jedoch gezeigt, 
daB Einsparungen an dieser Stelle erkauft werden mit 
einer deutlichen Verschlechterung des Einschwingver- 
haltens. Aufwandsgunstige Lflsungen lassen sich trotz- 
dem dadurch erzielen, daB in dem LMS-A!gorithmus 
nach Fig. 8 die 3 Projektionen P1 nicht gieichzeitig in 
einem 256-sample-lnputdatenblock abgearbeitet wer- 
den mOssen. Die mit 128-samples uberlappenden 
InputdatenblOcke der Lange 256 sind mit einer willkur- 
lich bei "V beginnenden Nummerierung in Fig. 19a 
skizziert So ist es z.B. mOglich bei modulo-3-Zahlweise 
der InputdatenblOcke die 3 Teilfilterprojektionen nicht 
parallel (Fig. 19b) sondern sequential in aufeinanderfol- 
genden BlOcken Fig. 19 zu berechnen. Dadurch sind 
bei idealer Projektion P1 pro Datenblock nicht 6 son- 
dern nur noch 2 FFTs notwendig. Es hat sich gezeigt, 
daB die Kompensation des Radiosignales auch noch 
ausreichend funktioniert, wenn die Abstande zwischen 
den zu berechnenden Teilfilter-Projektionen noch grO- 
Ber gewahlt werden. Zahlt man die BICcke z.B. modulo 
6, so ist lediglich in jedem zweiten Block eine Projektion 
Zu berechnen (Fig. 19d). Selbst eine Reduzierung auf 
einen Abstand von vier BlOcken zwischen zwei aufein- 
anderfolgenden P1 Berechnungen mittels modulo-12- 
Zahlung fuhrt noch zu brauchbaren Ergebnissen (Fig. 
19e). 

[0036] Die Leistungsfahigkeit des FLMS-Algorithmus 
mit 3 Teilfiltern gemaB Blockschaltung Fig. 8 und einer 
sequentiellen Berechnung der idealen Projektion P1 im 
Zeitraster nach Fig. 19e sowie der Projektion P2 mittels 



Faltung im Frequenzbereich (Fig. 16c) mit einem kom- 
plexen 7-Linien-Spektrum (Fig. 18) sei anhand von 3 
MeBszenen demonstriert. 

[0037] Die erste dieser Szenen Z2 beinhattet Sprach- 

5 eingabe von Ziffern, wobei der Radiolautsprecher anna- 
hernd weiBes Rauschen mit verhaitnismdBig hoher 
Lautstarke abstrahlt. Das zugehOrige 100000-sample- 
Mikrophonsignai ist in Fig. 20 oben, das extrahierte 
Ausgangssignal in Fig. 20 unten dargestellt. Eine deut- 

w liche Rauschbefreiung des Outputsignales gegenuber 
dem Mikrophoninput stellt man durch AbhOrvergleich 
test. Der zeitliche Verlauf des Sprachpausenmerkmals 
ist zusammen mit der konstanten Schwelle th Rg. 21 
oben abgebildet und die hieraus abgeleiteten Sprach- 

15 pausen bzw. die zugeordneten Schalterstellungen in 
Fig. 21 unten. SchlieBlich zeigt Fig. 22 in zu Rg. 15 ana- 
loger Weise die am Szenenende gefundene Impulsant- 
wort (a) und Obertragungsfunktion (b) auf der Basis der 
aktuellen Koeffizienten und die entsprechenden Grd- 

20 Ben (c), (d) auf der Basis der Sprachpauseneinstellung. 
Es ist deutlich erkennbar, daB die am Szenenende 
gefundene aktuelle Impulsantwort ein infblge Sprach- 
eingabe gestOrtes Ergebnis darstellt, wahrend die aus 
der letzten Sprachpause stammende Impulsantwort 

25 aus den gespeicherten Koeffizierrtensatzen eine hohe 
Qualitat aufweist. 

[0038] Die ersten 100000 samples einer MeBszene 
Z3 mit POP-Musik im Radio und flOssig bis schnell 
gesprochener Sprache der rechts hinten sitzenden Per- 

30 son sind in Form des Mikrophonsignales y in Fig. 23 
oben aufgezeichnet. Nach ca. 10000 samples (0,83 s) 
wird das Radiosignal brauchbar unterdrOckt (Fig. 23 
unten). Auch bei der im letzten Drittel dieser Szene ein- 
setzenden Spracheingabe bleibt die POP-Musikunter- 

35 druckung wirksam erhalten, wodurch die 
Sprachverstandlichkert hier gegenuber dem Mikrophon- 
signal merWich verbessert wird. Nach einer langen 
Sprachpause kommt es wegen der anschlieBenden 
pausenfreien Spracheingabe nicht mehr zu einer 

40 Schwellenunterschreitung (Rg. 24). Aus diesem 
Grunde ist die in Fig. 25 unten am Ende der Szene fest- 
gehaltene Impulsantwort auf der Basis der gespeicher- 
ten Koeffizienten zeitlich relativ veraltet. weil sie bereits 
ca. 2,3svorheraktuell war (215 BlOcke* 10,7 ms). Wie- 

45 der weist die aktuelle Impulsantwort (Fig. 25 oben) 
starke von der Spracheingabe herruhrende StOrungen 
auf. Wie ein Vergleich mit der ahnlichen Szene Z1 nach 
Figuren 11 bis 15 zeigt, ist trotz des stark verringerten 
Rechenaufwandes die Qualitat der StOrbef reiung unver- 

so andert noch. 

[0039] Die letzte Szene Z4 nach Fig. 26 wurde ohne 
Spracheingabe erstellt und soil abschlieBend nochmals 
die MusikunterdrOckungseigenschaften des beschrie- 
benen FLMS-Algorithmus demonstrieren. Nach ca. 

55 1 8000 samples bzw. 1 ,5 s wird - wie aus Fig. 26 unten 
ersichtlich • die Musik wirksam unterdrOckt. Diese 
Eigenschaft wird bis zum Szenenende mit unverdnder- 
ter Qualitat beibehalten. Fig. 27 zeigt auf, daB das 
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Sprachpausen-GrOBe fea Oberwiegend unter der 
Schwelle th bteibt Die Zeiten, in welchen auf die 
gespeicherten Koeffizienten zurOckgegriffen wird, sind 
demnach nur sehr kurz. Impulsarrtwort und Clbertra- 
gungsfunktion aus aktuellen Koeffizienten sind daher im 
wesentlichen mit den entsprechenden Veriaufen aus 
Sprachpausen-Koeffizienten identisch. 

PatentansprOche 

1. Verfahren zur StOrbefreiung eines Mikrophonsi- 
gnals von Anteilen eines Quellsignals, daB als 
Referenzsignal (x) vorliegt und nach Durchlaufen 
einer Ubertragungsstrecke mit a priori unbekannter 
Ubertragungsfunktion (G) sich im Mikrophonsignal 
als StOrsignal (r) einem Sprachsignal (s) uberla- 
gert, durch adaptive Nachbildung des Stfirsignals 
und Kompensation des tats&chlichen und des 
nachgebildeten Stflrsignals in einem Ausgangssi- 
gnat, wobei das Mikrophonsignal gleichfalls in den 
Frequenzbereich transformiert, die Kompensation 
an Signalen im Frequenzbereich vorgenommen 
und das im Frequenzbereich vorliegende Aus- 
gangssignal zur Adaption der Nachbildung mit dem 
im Frequenzbereich vorliegenden Referenzsignal 
verknupft wird. 

2. Verfahren nach Anspruch 1, dadurch gekenn- 
zeichnet, daB das Ausgangssignalspektrum in den 
Zeitbereich transformiert, das Zeitsignal durch Vor- 
anstellen von Nullwerten auf doppelte Ldnge 
gebracht, in den Frequenzbereich rOcktransformiert 
und der Nachbildung der Ubertragungsfunktion 
zugrundegelegt wird. 

3. Verfahren nach Anspruch 1, dadurch gekenn- 
zeichnet, daft das Ausgangssignalspektrum mit 
dem Spektrum eines Hamming-Zeitfensters gefal- 
tet wird und der Nachbildung der Ubertragungs- 
funktion zugrundegelegt wird. 

4. Verfahren nach einem der AnsprQche 1 bis 3, 
dadurch gekennzeichnet, daB zur Nachbildung des 
StCrsignalanteils eine adaptive Filterfunktion eines 
Nachbildungsfilters auf das Referenzsignal ange- 
wandt wird. 



7. Verfahren nach Anspruch 6, dadurch gekenn- 
zeichnet, daB auch bei Detektion eines Sprachsi- 
gnals die adaptive NachfQhrung einer aktuellen 
Filterfunktion zusatzlich zur Bildung des Ausgangs- 

5 signals fortgefQhrt wird. 

8. Verfahren nach Anspruch 7, dadurch gekenn- 
zeichnet, daB das Auftreten eines Sprachsignals 
aus einer Verdnderung der aktuellen Filterfunktion 

70 detektiert wird. 

9. Verfahren nach Anspruch 8, dadurch gekenn- 
zeichnet, daB die VerSnderung der aktuellen Filter- 
funktion fQr die Detektion des Auftretens eines 

15 Sprachsignals zeitlich gegl&ttet wird. 

10. Verfahren nach einem der AnsprQche 4 bis 9, 
dadurch gekennzeichnet, daB die Filterfunktion in 
mehrere Teilfilterfunktion zu aufeinanderfolgenden 

20 Abschnitten einer Gesamt-lmpulsantwort aller Teil- 
filter aufgespalten ist und auf Referenzsignalspek- 
tren zu zeitlich versetzten Zeitsegmenten des 
segmentierten Referenz-Zeitsignals angewandt 
wird. 

25 

11. Verfahren nach Anspruch 10, dadurch gekenn- 
zeichnet, daB die Adaption der Filterfunktion fur die 
Teilf ilter parallel durchgefQhrt wird. 

30 12. Verfahren nach Anspruch 10, dadurch gekenn- 
zeichnet, daB die Adaption der Filterfunktion fQr die 
einzelnen Teilf ilter zeitsequentiell durchgefQhrt 
wird. 

35 



40 



45 



5. Verfahren nach Anspruch 4, dadurch gekenn- 
zeichnet, daB die Filterfunktion durch einen Koeffi- 
zientenvektor vorgegeben wird, dessen so 
Koeffizienten adaptiv eingestellt werden. 



6. Verfahren nach Anspruch 4 oder 5, dadurch 
gekennzeichnet, daB das Auftreten eines Sprachsi- 
gnalanteils im Mikrophonsignal detektiert wird und 55 
bei Auftreten eines Sprachsignals die vor Auftreten 
des Sprachsignals eingestelfte Filterfunktion zur 
Bildung des Ausgangssignals beibehaften wird. 



8 



EP0 948 237 A2 




FIG.1 



9 



EP 0 948 237 A2 



-K T 

s = s + r - r 



s 

o 



y = s + r , , 

-►©— o — r-o 



Fahrzeug- 
innenraum 



Storung 



H 



adaptives 
Filter ^ 

a) Prinzip der Radiokompensation mit adaptivem Filter 
(LMS-Algorithmus) 



y - s + r 

o — 



X 

OH 



F 

no: 



ii£kj 



pi j 
i 



3E§ 




A A 

s = s + r - r 



J H' -qH'+AH' 1 

nr 1 .-p3-n 




i. 

b) Blockdiagramm des FLMS-Algorithmus 



o 



FIG.2 



10 



BP 0 848 297 A3 



CO 1 

Pd 



s 



c 
o 

s 

5 



I 



E 
cn 

V) 



I tj 



S3 



I 



JUm — I 

<50Cj= £ 



I 



E 
(0 



£ 

■i 




FIG.3 



11 



EP 0 948 237 A2 



y = s + r 

o 



A A 

+ = s + r - r. 



B' 



K' 



XJ 



an 



llplj 



m 



\X H' :=H'+AH' | 




|P2[^T|j 



'""pr"! 



o 



a) Blockdiagramm des FLMS-Algorithmus mit 1 Teilfilter 



v 



X1 



X2 



X3 | 
I 
I 



H1 



F 

no 



no 



no 



pi i 



pi 



F-1 



r-. ..HI' 



K1 



i. I 

H3' 



K2 



b) Erweiterung auf 3 Teilfilter 



1 A 

K3 



FIG.4 



12 



EP0948 237 A2 




oft 



oft 



K 



J H':=HV AK 



r 



s = s 



o 



Output 
im 

Frequenz- 
bereich 



I 



p1 



no P4i 



i 



a) FLMS-Algorithmen mit Output im Frequenzbereich 



FIG.5 



13 



EP 0 948 237 A2 




FIG.6 



EP0 948 237 A2 




FIG.7 



15 



EP 0 948 237 A2 




16 



EP 0 948 237 A2 



eIah 2 I— 
zIah 3 |— 



feat 



^rekTP 

1 . Ordnung 



fea 




Schalter- 
steuerung 
S1 , S2, S3 



th 



FIG.8a 





FIG.9 



17 



EP 0 948 237 A2 





FIG.10 



18 



EP 0 948 237 A2 





FIG.11 



19 



EP 0 948 237 A2 



Szene Z1/1 





FIG.12 



20 



EP0948237 A2 



Szene Z1/2 




i i i i i i 



01 234 56789 10 

X10 4 




FIG.13 



21 



EP 0 948 237 A2 




22 




FIG.15 



EP 0 948 237 A2 



b) 



C) 



Frequenzbereich 



1 



IFFT 



, 128 

fori 



FFT 



i 



Zeit- 
bereich 



IFFT 




r 


I 




i 


f 


FFT 



Frequenzbereich 



Faltung 
im 

Frequenzbereich 



ideale Projektion P4 modifizierte Projektion P4 zu b) Squivalente Faltung 
mit Rechteck-Fenster mit Hamming-Fenster im Frequenzbereich (Faltung 
im Zeitbereich im Zeitbereich mit 7-Linien Spektrum) 



FIG.16 



24 



EP 0 948 237 A2 




FIG.17 



25 



EP0 948 237 A2 



CO 

c 
N 




300 



E 
2 
2 

a 



E 





— 1 1 

o 




} O 0 O 0 


10 I ° ° I ° 

J . - 1 


O O 0 O 


0 


5 1 10 


15 




I * 

- T 1 . . 




; i o 

« . t 


— o — O O Ci 


0 


5 ' 10 

4-"Kurze" Impulsantwort — ► 


15 



FIG. 18 



26 



EP0 948 237 A2 



a) 





4-256-* 






1 


3 


5 


7 


9 





6 



8 



10 



}4— 256->J 



*21 ,35ms' 



b) 



P1 in 




1 


2 


3 


4 5 / 


Teil- i 


1 












Filter^ 


2 










H> 


Nr. . 


3 













Block-Nr. 



c) 



P1 in 
Teil- | 
Filter^ 
Nr. 







4 5 6 




1 


• 


• 




2 


• 


• • 




3 


♦ 


• 





Block-Nr. 



P1 



d) 



in 

Teil- I 
Fitter^- 
Nr. 



ff)2g)4g)6 7 8 91011 12 1314 



Block-Nr. 



1 


• 


• 




2 


• 


• 


Ft 


3 


• 


• 





e) 



P1 in 
Teil- | 

Filter4 
Nr. 



1 


• 




2 


• 




3 


• 





Block-Nr. 



a) Numerierung der Gberlappenden FFT-Blficke 

b) Projektion P1 parallel In 3 Teilfiltern 

c) Projektion P1 sequentiell in 3 Teilfiltern (Blockmodule 3) 

d) Projektion P1 sequentiell in 3 Teilfiltern (Blockmodule 6) 

e) Projektion P1 sequentiell in 3 Teilfiltern (Blockmodule 12) 

FIG.19 



27 



EP 0 948 237 A2 





FIG.20 



28 



EP 0 948 237 A2 




I I I I i i 



Aus- 




in 



0 100 200 300 400 500 600 700 800 



FIG.21 



29 



EP0 948 237 A2 



Szene Z2 




(a) 



400 



— — r . — r - T . 

« 1 • 
t • 1 


1 "'I ' ~ 

t • 1 
» 1 


r . .. — 

i i 
i 


i 


I — : — 














(c) 



400 




FIG.22 



EP 0 948 237 A2 



Szene Z3 

x10 4 

4i i i ii i i i i r 




I L-— _l 1 1 I 1 I 1 i 

01 234 56789 10 

x10 4 




01 234 56789 10 



samples x10 



FIG.23 



I 



31 



EP 0 948 237 A2 



tea 




100 200 300 400 500 600 700 800 




Aus 



0 100 200 300 400 500 600 700 800 



FIG.24 



32 



EP0 948 237 A2 




EP 0 948 237 A2 



Szene Z4 




100 200 300 400 500 600 700 800 




Aus 



100 200 300 400 500 600 700 800 



FIG.27 



35 



EP 0 948 237 A2 




36 



